草庐IT

MySQL ORDER BY 多列 ASC 和 DESC

全部标签

python - 在 Pandas 聚合函数中创建多列

我想在像内置的ohlc方法一样对pandasDataFrame进行重采样时创建多个列。defmhl(data):returnpandas.Series([np.mean(data),np.max(data),np.min(data)],index=['mean','high','low'])ts.resample('30Min',how=mhl)死于Exception:Mustproduceaggregatedvalue有什么建议吗?谢谢! 最佳答案 您可以将函数字典传递给resample方法:In[35]:tsOut[35]:20

TTK按钮跨越多列

我正在尝试制作一个TTK按钮,该按钮跨越框架内的多个列。基本上,我有两行按钮,我希望两个行下面的最后一个按钮跨越两个行的宽度。但是,我不确定如何实现这一目标。这是我在按钮上的代码:btnOff=ttk.Button(self,text="OFF",command=tc.Off).grid(column=1,row=10,columnspan=2,rowspan=2)我尝试增加列宽度,但似乎无济于事。实际上,即使我只是尝试将其设置为正常设置,它也比其上方行中的其他按钮小,即使所有这些按钮都具有与我上面发布的相同的网格代码。看答案示例展开最后两列。第10行和第1列Python2importTkin

python - pandas DataFrame 多列的并排箱线图

一年的样本数据:importpandasaspdimportnumpy.randomasrndimportseabornassnsn=365df=pd.DataFrame(data={"A":rnd.randn(n),"B":rnd.randn(n)+1},index=pd.date_range(start="2017-01-01",periods=n,freq="D"))我想按月份并排绘制这些数据的箱线图(即,每月两个箱子,一个用于A,一个用于B)。对于单列sns.boxplot(df.index.month,df["A"])工作正常。但是,sns.boxplot(df.index.

python - Pandas 的多列分解

pandasfactorize函数将系列中的每个唯一值分配给一个从0开始的顺序索引,并计算每个系列条目属于哪个索引。我想在多个列上完成与pandas.factorize等效的操作:importpandasaspddf=pd.DataFrame({'x':[1,1,2,2,1,1],'y':[1,2,2,2,2,1]})pd.factorize(df)[0]#wouldlike[0,1,2,2,1,0]也就是说,我想确定一个数据帧的几列中每个唯一的值元组,为每个值分配一个顺序索引,并计算数据帧中的每一行属于哪个索引。Factorize仅适用于单列。pandas中是否有多列等价函数?

python - 从元组到 Pandas 中的多列

我如何转换这个数据框locationvalue0(Richmond,Virginia,nan,USA)1001(NewYorkCity,NewYork,nan,USA)200为此:citystateregioncountryvalue0RichmondVirginiananUSA1001NewYorkCityNewYorknanUSA200请注意,第一个数据框中的location列包含元组。我想在location列中创建四列。 最佳答案 new_col_list=['city','state','regions','country'

python - PySpark 将 'map' 类型的列转换为数据框中的多列

输入我有一列Parameters类型为map的形式:frompyspark.sqlimportSQLContextsqlContext=SQLContext(sc)d=[{'Parameters':{'foo':'1','bar':'2','baz':'aaa'}}]df=sqlContext.createDataFrame(d)df.collect()#[Row(Parameters={'foo':'1','bar':'2','baz':'aaa'})]df.printSchema()#root#|--Parameters:map(nullable=true)#||--key:str

python - 从一个函数在 Pandas Dataframe 中创建多列

我是一个Python新手,所以我希望我的两个问题是清楚和完整的。我在下面以csv格式发布了实际代码和测试数据集。我已经能够构建以下代码(主要是在StackOverflow贡献者的帮助下)来使用Newton-Raphson方法计算期权合约的隐含波动率。该过程在确定隐含波动率时计算Vega。虽然我可以使用PandasDataFrameapply方法为隐含波动率创建一个新的DataFrame列,但我无法为Vega创建第二个列。当函数同时返回IV和Vega时,有没有办法创建两个单独的DataFrame列?我试过:从函数返回iv,vegadf[['myIV','Vega']]=df.apply(

python - 在 Pandas 中设置多列索引

我像这样制作数据框。df=pd.DataFrame({'class':['A','A','A','A','A','B','B','B','B','B'],'number':[1,2,3,4,5,1,2,3,4,5],'math':[90,20,50,30,57,67,89,79,45,23],'english':[40,21,68,89,90,87,89,54,21,23]})我想使用一些pandas方法将索引转换为此。(例如set_index、堆栈、、、)df1=pd.DataFrame(np.random.randint(1,100,(5,4)),columns=[['A','A'

python - Pandas ,将多列的多个功能应用于groupby对象

我想将多列的多个函数应用到一个groupby对象,从而产生一个新的pandas.DataFrame。我知道如何分步完成:by_user=lasts.groupby('user')elapsed_days=by_user.apply(lambdax:(x.elapsed_time*x.num_cores).sum()/86400)running_days=by_user.apply(lambdax:(x.running_time*x.num_cores).sum()/86400)user_df=elapsed_days.to_frame('elapsed_days').join(runn

python - 如何在 Spark SQL 中对多列进行透视?

我需要在PySpark数据框中旋转多个列。示例数据框:frompyspark.sqlimportfunctionsasFd=[(100,1,23,10),(100,2,45,11),(100,3,67,12),(100,4,78,13),(101,1,23,10),(101,2,45,13),(101,3,67,14),(101,4,78,15),(102,1,23,10),(102,2,45,11),(102,3,67,16),(102,4,78,18)]mydf=spark.createDataFrame(d,['id','day','price','units'])mydf.sh